L'informatique de la santé se situe à la croisée des données médicales et de la technologie, transformant des informations brutes en connaissances actionnables pour améliorer les soins. Ce domaine englobe tout, de l'analyse de grands ensembles de données cliniques à la création d'outils numériques qui aident les médecins à prendre des décisions plus rapides et plus précises.

Sur Gist.Science, nous suivons de près les dernières avancées de ce secteur en traitant chaque nouveau prépublication soumise sur medRxiv. Pour chaque étude, nous proposons une explication claire en langage courant ainsi qu'un résumé technique détaillé, rendant la recherche complexe accessible à tous les publics.

Vous trouverez ci-dessous la sélection la plus récente de ces travaux, offrant un aperçu direct des innovations qui façonnent l'avenir de la médecine numérique.

Development of a natural language processing application to extract and categorize mentions of violence from mental healthcare records text

Cette étude présente le développement d'une application de traitement du langage naturel basée sur le modèle BERT, capable d'extraire et de catégoriser avec une grande précision diverses formes de violence et leurs caractéristiques à partir des notes cliniques textuelles non structurées des dossiers de santé électronique en santé mentale.

Li, L., Sondh, S., Sondh, H. K., Stewart, R., Roberts, A.2026-03-26📄 health informatics

A statistical framework for evaluating the repeatability and reproducibility of large language models

Cet article présente un cadre statistique réglementaire qui quantifie la répétabilité et la reproductibilité des grands modèles de langage selon des dimensions sémantiques et internes, révélant que ces métriques dépendent fortement de la stratégie d'incitation utilisée et ne sont pas nécessairement corrélées à la précision diagnostique.

Shyr, C., Ren, B., Hsu, C.-Y., Yan, C., Tinker, R. J., Cassini, T. A., Hamid, R., Wright, A., Bastarache, L., Peterson, J. F., Malin, B. A., Xu, H.2026-03-25📄 health informatics

Wearable-derived cardiovascular fitness age and its lifestyle correlates in 442 adults

Cette étude démontre que l'âge cardiovasculaire dérivé de données de wearables chez 442 adultes reflète significativement des habitudes de vie indépendantes de l'algorithme, notamment la qualité du sommeil et l'activité physique, tout en suivant les améliorations physiologiques au fil du temps.

Shanmugam, A., Gupta, K., Dhawale, N., Singhal, V., Kumar, M., Srinivasan, B., Narasimhan, V.2026-03-25📄 health informatics

Human-supervised, large language model-based clinical decision support aligned to national newborn protocols in Kenya: a pragmatic, early-stage evaluation

Cette étude d'évaluation précoce démontre que le système d'aide à la décision clinique AIFYA, basé sur un modèle de langage large supervisé par des humains et aligné sur les protocoles nationaux, a été mis en œuvre avec succès dans des établissements de santé publics au Kenya, obtenant une forte adhésion des professionnels de santé et un taux élevé de conformité aux recommandations cliniques.

Kuria, T., Kamau, G., Makokha, F., Omondi, P., Mbugua, G., David, K., Mbugua, S., Gitaka, J.2026-03-25📄 health informatics

Medical errors in large language models revealed using 1,000 synthetic clinical transcripts

Bien que les modèles de langage comme GPT-5.2 affichent une haute précision diagnostique sur des histoires complètes, une nouvelle évaluation par simulation de 1 000 transcripts cliniques révèle qu'ils génèrent des recommandations dangereuses et des erreurs de triage, notamment en décourageant des investigations essentielles et en présentant des biais de sécurité significatifs envers les patientes, en particulier dans les cas de données incomplètes.

Auger, S. D., Scott, G.2026-03-25📄 health informatics

The Power of Open Health Data: Impact, Representation, and Knowledge Diffusion

Cette étude évalue l'impact et la diffusion des connaissances de quatre grandes bases de données de santé ouvertes, révélant une amplification citationnelle indirecte d'environ 10 fois, des disparités significatives dans la composition démographique des auteurs selon le type de ressource, et une persistance des inégalités de genre au sein des positions d'auteurs seniors que l'accès aux données seul ne suffit pas à résoudre.

Gorijavolu, R., Armengol de la Hoz, M. A., Bielick, C., Cajas, S., Charpignon, M.-L., El Mir, A., Gichoya, J. W., Kwak, H. G., Madapati, K., Mattie, H., McCullum, L., Mwavu, R., Nair, V., Nakayama, L. (…)2026-03-24📄 health informatics

Social Determinants of Health and Chronic Disease Risk Prediction in the All of Us Research Program

En analysant les données de près de 260 000 participants du programme All of Us, cette étude démontre que l'intégration des déterminants sociaux de la santé améliore la prédiction des maladies chroniques, révélant que les facteurs expérientiels comme le stress prédisent mieux la santé mentale tandis que les caractéristiques démographiques et structurelles influencent davantage les maladies cardiométaboliques, ce qui plaide pour des interventions ciblées plutôt que des approches universelles.

Kammer-Kerwick, M., Dave, Y., Parekh, V., McDonald, L., Watkins, S. C.2026-03-23📄 health informatics

Impact of a Social Media Derived Digital Self Management Platform on Population Level Irritable Bowel Syndrome Emergency Utilization: A Controlled Interrupted Time Series Analysis Using South Korean National Health Insurance Data

Cette étude démontre qu'une plateforme de gestion numérique de la santé, conçue à partir de l'analyse des discussions sur les réseaux sociaux concernant le syndrome de l'intestin irritable, a entraîné une réduction significative et durable des visites aux urgences et des hospitalisations non planifiées en Corée du Sud, confirmant ainsi l'efficacité des interventions de santé publique fondées sur les données numériques.

Park, J.-H., Lim, A.2026-03-23📄 health informatics

Automated Extraction of Cancer Registry Data from Pathology Reports: Comparing LLM-Based and Ontology-Driven NLP Platforms

Cette étude démontre que la plateforme d'extraction basée sur les grands modèles de langage (LLM) Brim Analytics atteint une précision élevée et comparable à celle du système DeepPhe pour l'automatisation de l'extraction des données de registres de cancer à partir de rapports de pathologie, tout en offrant des temps de traitement compétitifs.

McPhaul, T., Kreimeyer, K., Baris, A., Botsis, T.2026-03-23📄 health informatics